13 research outputs found
BUCEADOR hybrid TTS for blizzard challenge 2011
This paper describes the Text-to-Speech (TTS) systems presented by the Buceador Consortium in the Blizzard
Challenge 2011 evaluation campaign. The main system is a concatenative hybrid one that tries to combine the strong points of both statistical and unit selection synthesis (i.e. robustness and segmental naturalness respectively). The hybrid system has reached results significantly above average
as far as similarity and naturalness are concerned, with no significant differences with most of the systems in the
intelligibility task. This clearly improves the performance achieved in previous participations, and shows the validity of
the hybrid approach proposed. Besides, an HMM-based system was built for the ES1 intelligibility tasks, using an
HNM-based vocoder.Peer ReviewedPostprint (published version
Una experiència d’ensenyament de la sostenibilitat a l’arquitectura mitjançant el treball interdisciplinar
El següent article explica l’experiència docent pilot anomenada “Rehabilitem
l’ETSAB?” que es va dur a terme dins del marc del programa Sostenibilitat,
Tecnologia i Excel·lència per al 2015 (STEP2015) de la Universitat
Politècnica de Catalunya.
“Rehabilitem l’ETSAB?” va consistir en un taller intensiu d’una setmana que
es va realitzar a l’Escola Tècnica Superior d’Arquitectura de Barcelona
durant el mes de juliol de 2010. L’objectiu del taller era crear un espai de
reflexió sobre sostenibilitat i l’adequació de l’edificació existent als
requeriments ambientals i climàtics actuals a través de la docència
transversal portada a terme per professors de diferents matèries i
departaments, les conferències temàtiques i el treball i debat en grups
d’estudiants. Aprofitant els coneixements adquirits a les classes teòriques i
els inputs de les conferències, els alumnes van treballar sobre els dos
edificis de l’Escola Tècnica Superior d’Arquitectura de Barcelona analitzantlos
i elaborant, a nivell conceptual, propostes de millora energètica i de
rehabilitació sostenible.Peer Reviewe
Adaptación del CTH-URL para la competición ALBAYZIN 2008
En esta comunicación describimos el sistema de síntesis de voz presentado a la competición Albayzin 2008. Es un sistema que
sigue un esquema clásico de concatenación de unidades basado en corpus. Cabe destacar que los costes de selección se han ajustado mediante un método basado en algoritmos genéticos y que no se ha utilizado ningún sistema de predicción prosódica.
Se construyeron dos sistemas preliminares que diferían en el algoritmo de generación de forma de onda escogiendo el que se
presenta a la competición mediante un test perceptual.Peer ReviewedPostprint (published version
BUCEADOR, a multi-language search engine for digital libraries
This paper presents a web-based multimedia search engine built within the Buceador (www.buceador.org) research project. A proof-of-concept tool has been implemented which is able to retrieve information from a digital library made of multimedia documents in the 4 official languages in Spain (Spanish, Basque, Catalan and Galician). The retrieved documents are presented in the user language after translation and dubbing (the four previous languages + English). The paper presents the tool functionality, the architecture, the digital library and provide some information about the technology involved in the fields of automatic speech recognition, statistical machine translation, text-to-speech synthesis and information retrieval. Each technology has been adapted to the purposes of the presented tool as well as to interact with the rest of the technologies involved.Peer ReviewedPostprint (published version
Analysis of prosodic features : towards modelling of emotional and pragmatic attributes of speech
Aunque las tecnologías de voz mejoran de forma constante sus prestaciones,
es necesario comprender los mecanismos utilizados en el habla para transmitir,
además del léxico, otras informaciones como la emoción, actitud o estilos
del hablante. En este trabajo nos hemos centrado en el estudio de la correlación
de los parámetros básicos de la prosodia con características del tipo emocional y
pragmático. Para ello, se han utilizado tres corpora: grabaciones de voz con emoción,
lectura de una novela y sesiones del parlamento español. Basándonos en una taxonomía de emociones y modos del discurso, hemos planteado el estudio mediante
una tarea de clasificación en base a las características prosódicas. Los resultados
preliminares muestran que podemos identificar claramente las emociones y también
que hay una correlación significativa entre prosodia y atributos pragmáticos.Although speech technologies keep improving their performance, it is
necessary to understand the mechanisms used in speech to transmit, a part from
lexical, other information such as emotion, attitude or speaker styles. In this work
we have focused on the study of the correlation of basic prosodic features with
emotional and pragmatic characteristics. For that purpose, three corpora have been
used: emotional recorded speech, a read tale and Spanish parliament recordings.
Based on an emotion and discourse modes taxonomy, we performed a classifying
task of such characteristics by means of the prosodic features. Preliminary results
show that emotions can be identified from prosody and that also exists a correlation
between prosody and pragmatic attributes.This work has been partially sponsored by the European
Union under grant FP6-506738 (TC-STAR
project, http://www.tc-star.org) and the Spanish
Government under grant TIC2002-04447-C02 (ALIADO
project, http://gps-tsc.upc.es/veu/aliado) and
grant TIC2003-083820C05-03
BUCEADOR hybrid TTS for blizzard challenge 2011
This paper describes the Text-to-Speech (TTS) systems presented by the Buceador Consortium in the Blizzard
Challenge 2011 evaluation campaign. The main system is a concatenative hybrid one that tries to combine the strong points of both statistical and unit selection synthesis (i.e. robustness and segmental naturalness respectively). The hybrid system has reached results significantly above average
as far as similarity and naturalness are concerned, with no significant differences with most of the systems in the
intelligibility task. This clearly improves the performance achieved in previous participations, and shows the validity of
the hybrid approach proposed. Besides, an HMM-based system was built for the ES1 intelligibility tasks, using an
HNM-based vocoder.Peer Reviewe
BUCEADOR hybrid TTS for blizzard challenge 2011
This paper describes the Text-to-Speech (TTS) systems presented by the Buceador Consortium in the Blizzard
Challenge 2011 evaluation campaign. The main system is a concatenative hybrid one that tries to combine the strong points of both statistical and unit selection synthesis (i.e. robustness and segmental naturalness respectively). The hybrid system has reached results significantly above average
as far as similarity and naturalness are concerned, with no significant differences with most of the systems in the
intelligibility task. This clearly improves the performance achieved in previous participations, and shows the validity of
the hybrid approach proposed. Besides, an HMM-based system was built for the ES1 intelligibility tasks, using an
HNM-based vocoder.Peer Reviewe
Una experiència d’ensenyament de la sostenibilitat a l’arquitectura mitjançant el treball interdisciplinar
El següent article explica l’experiència docent pilot anomenada “Rehabilitem
l’ETSAB?” que es va dur a terme dins del marc del programa Sostenibilitat,
Tecnologia i Excel·lència per al 2015 (STEP2015) de la Universitat
Politècnica de Catalunya.
“Rehabilitem l’ETSAB?” va consistir en un taller intensiu d’una setmana que
es va realitzar a l’Escola Tècnica Superior d’Arquitectura de Barcelona
durant el mes de juliol de 2010. L’objectiu del taller era crear un espai de
reflexió sobre sostenibilitat i l’adequació de l’edificació existent als
requeriments ambientals i climàtics actuals a través de la docència
transversal portada a terme per professors de diferents matèries i
departaments, les conferències temàtiques i el treball i debat en grups
d’estudiants. Aprofitant els coneixements adquirits a les classes teòriques i
els inputs de les conferències, els alumnes van treballar sobre els dos
edificis de l’Escola Tècnica Superior d’Arquitectura de Barcelona analitzantlos
i elaborant, a nivell conceptual, propostes de millora energètica i de
rehabilitació sostenible.Peer Reviewe
Adaptación del CTH-URL para la competición ALBAYZIN 2008
En esta comunicación describimos el sistema de síntesis de voz presentado a la competición Albayzin 2008. Es un sistema que
sigue un esquema clásico de concatenación de unidades basado en corpus. Cabe destacar que los costes de selección se han ajustado mediante un método basado en algoritmos genéticos y que no se ha utilizado ningún sistema de predicción prosódica.
Se construyeron dos sistemas preliminares que diferían en el algoritmo de generación de forma de onda escogiendo el que se
presenta a la competición mediante un test perceptual.Peer Reviewe